Národní úložiště šedé literatury Nalezeno 3 záznamů.  Hledání trvalo 0.01 vteřin. 
Empirické porovnání metod nahrazování chybějicích hodnot v datech
Ostrenska, Alona ; Holý, Vladimír (vedoucí práce) ; Zouhar, Jan (oponent)
Chybějící hodnoty jsou přítomné ve všech typech dat, jako jsou například různé průzkumy, společenskovědní informace atd. V mnoha aplikacích je nezbytné nahradit chybějící pozorování, aby byla zachována velikost datového souboru potřebná pro sledované statistiky. V práci jsou nejdříve představeny kategorie příčin chybění pozorování v datech a problémy s nimi spojené. Dále práce seznamuje s běžnými metodami imputace chybějících hodnot a je vysvětlena jejích aplikace na reálných datech v kontextu lineární regrese. Následně se ověřují předpoklady lineárních regresních modelů na datech s umělé vytvořenými chybějícími pozorováními. Tato pozorování jsou odstraněna pomocí zmíněných mechanismů a různého podílu chybění hodnot s následnou imputací sedmi zkoumanými metodami. Regresní modely zkonstruované na základě takto imputovaných dat se pak statisticky verifikují. Nakonec se imputované modely porovnávají mezi sebou pomocí různých statistik a vizualizací. Dále se navrhují konkrétní imputační metody v případě faktického problému chybějících dat.
Využití data miningových metod při zpracování dat z demografických šetření
Fišer, David ; Šídlo, Luděk (vedoucí práce) ; Kraus, Jaroslav (oponent)
VYUŽITÍ DATA MININGOVÝCH METOD PŘI ZPRACOVÁNÍ DAT Z DEMOGRAFICKÝCH ŠETŘENÍ Abstrakt Cílem předkládané práce bylo popsat a následně demonstrovat na modelové úloze principy procesu dolování znalostí z databází, často označovaného jako data mining (DM). V teoretické části práce jsou popsány vybrané metodiky, na základě kterých se postupuje při DM procesu a dále jsou zjednodušeně popsány principy vybraných DM technik. V druhé části práce je pak realizována DM úloha, ve které se postupuje dle metodiky CRISP-DM. Jako modelová data pro tuto úlohu jsou vybrána data z výběrového šetření American Community Survey. Praktická část práce je rozdělena na dvě části. V první části je vyhotovena klasifikační úloha, jejíž cílem je zjistit, zda lze využít vybrané DM techniky k řešení problematiky chybějících údajů ve statistických šetřeních. Úspěšnost klasifikace a následné predikce hodnot u vybraných atributů se pohybovala v intervalu 55-80 %. Druhá část praktické části práce je pak zaměřena na hledání zajímavých znalostí ve vybraných datech pomocí asociačních pravidel a metody GUHA. Klíčová slova: data mining, dolování znalostí z databází, statistická šetření, chybějící hodnoty, klasifikace, asociační pravidla, metoda GUHA, ACS
Porovnání statistických programových systémů SPSS, STATISTICA a SAS z hlediska jejich možností při analýze kategoriálních dat
Torboněnko, Natalja ; Řezanková, Hana (vedoucí práce) ; Pecáková, Iva (oponent)
V bakalářské práci jsou porovnávány tři nejznámější statistické systémy z hlediska jejich využití při analýze kategoriálních dat. Systémy SPSS, STATISTICA a SAS Enterprise Guide jsou snadno ovladatelné (pomocí nabídek z menu), umožňují použít širokou škálu statistických metod, které od uživatele nevyžadují znalost programovacích jazyků. V práci jsou podrobně porovnány následující základní nástroje: vstup dat, možnost popsat proměnné a jednotlivé kategorie, možnost definovat chybějící údaje, sestavování tabulek rozdělení četností (včetně tabulek pro vícehodnotové odpovědi), vizualizace rozdělení četností (na příkladě sloupcového grafu), základní popisné charakteristiky, binomický test, chí-kvadrát test dobré shody.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.